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摘 要 : 针对 现 阶段 我 国 区 域 能 源 安全 突 发 事件 频 现 的 问题 ， 对 区 域 能 源 安全 外 生 警 源 隐 含 特性 展开 了 研究 。 通 过 对 
区 域 能 源 安 全 事件 案例 抽取， 构建 了 能 源 安 全 外 生 警 源 属性 集 和 数据 集 。 依 据 数 据 集 的 特点 ， 设 计 了 能 源 安 全 外 生 警 
源 多 维 关联 规则 挖掘 模型 。 该 模型 首先 基于 多 维 属性 融合 的 思路 ， 通 过 把 属性 划分 为 事务 项 ， 将 外 生 警 源 多 维 属性 映 
射 为 一 维 ， 然 后 利用 Apriori 算法 的 基本 原理 进行 规则 挖 据 。 在 此 基础 上 ,将 该 模型 应 用 于 能 源 安全 外 生 警 源 隐 含 特征 
分 析 中 ， 研 究 警 源 属性 间 的 关联 关系 ， 实 现 强 关 联 规则 输出 。 研 究 结 果 表 明 ， 多 维 关联 规则 方法 可 以 发 现 隐藏 在 外 生 
警 源 数据 中 的 规律 ， 通 过 对 挖掘 出 规则 集 的 归纳 分 析 ， 得 出 区 域 能 源 安全 外 生 警 源 爆发 时 具有 衍生 性 、 季 节 性 、 危 害 
性 和 持续 性 等 共性 特征 。 
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Analysis on implicit characteristics of regional energy security exogenous source based on 
multi-dimensional association rule 


Hu Jian, Pu Dong, Sun Jinhua 
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Abstract: According to the problem of frequent occurrence of regional energy events in our country, this paper makes a deep 
study on the implicit characteristics of regional energy security exogenous source. This research constructs the attribute set and 
data set of regional energy security exogenous source through extracting different cases, and in the light of the data set features, 
designs a multi-dimensional association rule mining model on regional energy security exogenous source. Based on the idea of 
multi-dimensional attribute fusion, the model firstly maps the multi-dimensional attributes to one dimension by dividing the 
attributes into items, and then mines the rules with the basic principle of Apriori algorithm. On the basis, this paper uses this 
model to analyze the implicit characteristics of the regional energy security exogenous source, which makes a research on the 
relationship between these attributes in order to output the strong association rules. The research results show that multi- 
dimensional association rule model can find the implicit characteristics of the regional energy security exogenous source, which 
are derivative, seasonality, harmfulness and durability. 
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characteristic 
0 ”引言 突然 出 现 了 大 规模 “ 气 范 ” 诱发 这 些 事件 的 源头 更 多 是 由 于 能 
吾 


源 系 统 外 部 因素 的 突然 变化 所 致 。 然 而 ， 目 前 我 国 能 源 安 全 体 
近年 来 不 断 频 发 的 区 域 能 源 安全 突 发 事件 ， 已 对 我 国 各 地 。 ” 系 尚 无 法 对 引发 区 域 能 源 安全 事件 的 外 生 警 源 进行 有 分 析 ， 从 
区 的 经 济 发 展 和 社会 稳定 造成 了 严重 影响 。 例 如 ，2008 年 初 ， 而 造成 了 区 域 能 源 供需 缺口 现象 频 现 。 因 此 ， 深 入 挖掘 区 域 能 
于 暴雪 引发 的 自然 灾害 严重 影响 了 电网 运行 ， 全 国 19 个 省 。 源 安全 外 生 警 源 的 隐 含 特性 ， 对 于 区 域 能 源 安全 有 效 预警 研究 
出 现 了 大 范围 拉 闸 停电 ，2011 年 以 来 ， 重 庆 地 区 因 贵州 和 四 |) 具有 重要 的 意义 

等 煤炭 能 源 产 地 突然 对 煤炭 外 销 和 运输 实行 严格 控制 ， 致 使 电 前 在 区 域 能 源 安全 研究 成 果 中 ， 多 集中 于 从 宏观 整体 层 
煤 出 现 供应 紧张 。2013 年 11 月 ， 我 国 华北 和 西南 地 区 10 余 省 ， 面 来 研究 能 源 安全 问题 。Vladol1 建 立 了 基于 一 种 新 的 和 扩大 概 
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录用 定稿 胡 健 等 : 基于 多 维 关 联 规则 的 区 域 能 源 航 


念 化 的 能 源 安 全 评估 工具 ， 充 分 考虑 了 每 个 国家 或 地 区 的 能 源 ， 识 警 防 患 ， 超 前 预 控 。 
安全 和 政策 的 定量 和 定性 属性 , 从 11 类 维度 对 能 源 安 全 进行 测 区 域 能 源 安全 外 生 警 源 是 指 由 于 区 域 能 源 系统 的 外 部 影响 
评 。 Andreas 等 人 外 则 对 能 源 安全 指标 体系 的 构成 进行 了 深入 探 ” 因素 发 生变 化 ， 如 能 源 价格 的 波动 、 能 源 政策 的 调整 、 突 发 
讨 , 认为 衡量 能 源 安全 指标 包括 预测 性 指标 和 结果 指标 两 大 类 。 ” 然 灾 害 等 ， 导 致 区 域 能 源 系统 随 之 产生 扰动 ， 并 由 此 引发 威胁 
刘 立 涛 等 人 中 系统 地 构建 了 我 国 区 域 能 源 安全 评价 指标 体系 ， 区 域 能 安全 的 连锁 反映 事件 。 本 文 将 这 些 影响 区 域 能 源 系统 安 
并 选取 广东 与 陕西 作为 能 源 输入 与 输出 区 代表 ， 对 两 省 能 源 安 。 全 的 外 部 性 要 素 界定 为 外 生 警 源 。 外 生 警 源 是 分 析 突 发 区 域 能 
全 展开 实证 分 析 。 赵 春 富 等 人 外 建议 从 供应 链 的 角度 出 发 ， 考 。 源 安全 警 情 的 重要 外 部 根源 ， 是 区 域 能 源 安 全 和 警 情 的 策 源 地 。 
虑 能源 系统 内 部 各 因素 及 与 外 部 因素 的 相互 作用 ， 构 建 链 式 世 研究 区 域 能 源 安全 外 生 警 源 是 区 域 能 源 安全 预警 的 新 的 
预警 体系 。 范 秋芳 四 则 通过 对 特定 能 源 安全 预警 问题 分 析 ， 逻辑 起 点 ， 其 关键 就 在 于 如 何 有 效 识别 出 区 域 能 源 安全 外 生 和 警 
于 BP 神经 网 络 的 基本 原理 ， 构 建 了 石油 安全 监测 预警 方法 与 。” 源 及 其 形成 机 理 。 
模型 ,并 开展 了 实证 应 用 分 析 口 。 郭 金 栋 等 从 煤炭 安全 压力 、 状 ”1.2 区 域 能 源 安 全 外 生 警 源 的 类 型 

态 和 响应 3 个 子 系统 出 发 构建 了 煤炭 安全 测度 指标 体系 ， 评 价 引发 区 域 能 源 安全 的 外 部 影响 因素 很 多 ， 包 括 宏观 经 济 、 
了 煤炭 安全 的 程度 。 苏 飞 等 人 习 在 构建 区 域 能 源 安 全 脆弱 性 评 ”能 源 政策 、 环 境 因素 、 突 发 因素 等 。 本 文 收集 了 区 域 能 源 安全 
估 模 型 及 其 评价 指标 体系 的 基础 上 ， 对 我 国 30 个 地 区 的 常规 上 型 事件 ， 发 现 引 发 区 域 能 源 安全 事件 的 根源 大 多 是 能 源 系 统 
能 源 安全 供给 脆弱 性 进行 了 定量 评估 。 吴 初 国 等 人 多 对 能 源 安 。 的 外 部 因素 ， 在 总 结 区 域 能 源 安全 事件 成 因 及 演化 过 程 的 基础 
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全 的 标准 进行 了 界定 ， 采 用 综合 评分 法 和 炉 权 系 数 法 两 种 方法 上， 并 依据 以 上 外 部 影响 因素 ， 从 外 生 警 源 的 形成 机 理 角 度 将 
计算 了 评价 指标 的 权重 ， 对 不 同 的 情景 下 我 国 能 源 安全 进行 了 ”外 生 警 源 划 分 为 以 下 几 类 : 

评价 。 胡 剑 波 等 人 外 从 压力 、 状 态 、 响 应 等 三 个 方面 构建 9 个 a) 能 源 价格 波动 。 由 于 我 国 的 能 源 价格 由 政府 管制 ， 能源 
指标 来 评价 中 国 的 能 源 安全 状况 。 张 强 509 利 用 综合 集成 复杂 系 ” ”价格 的 定价 机 制 不 是 由 市 场 供需 决定 ， 所 以 能 源 价格 的 扰动 会 


统 问 题 研究 方法 ， 构 建 了 能 源 安全 预警 系统 ， 并 详细 给 出 了 系 ”打破 局 部 地 区 的 能 源 供需 平衡 ， 从 而 形成 干扰 区 域 能 源 安全 的 
统 的 设计 和 实现 方法 。 而 周 德 群 等 人 上 学 者 则 采用 Hilbert。 ”外 生 警 源 ， 最 终 诱发 区 域 能 源 安全 事件 。 
huang 变换 的 方法 构造 石油 价格 波动 预警 分 量 ， 以 此 来 对 历次 以 成 品 油 为 例 ， 国 内 能 源 定价 机 制 决 定 了 成 品 油价 格 在 政 
石油 价格 波动 过 程 展 开 预警 分 级 研究 。 郭 玲玲 等 人 [9 运用 系统 。” 府 规制 的 范围 内 ， 批 发 企业 可 通过 相对 灵活 的 措施 适时 请 
动力 学 理论 构建 中 国 能 源 安全 的 系统 动力 学 模型 ， 模 拟 得 到 三 格 。 在 这 种 情况 下 ， 当 成 品 油 批发 企业 突然 上 涨 价格 时 ， 
种 我 国 能 源 安全 系统 的 发 展 模式 。 郝 平等 人 0 利用 数据 仓库 和 零售 企业 受制 于 政府 严格 的 定价 机 制 ， 导 致 其 价格 调整 相克 
关联 规则 挖掘 方 法 建立 了 区 域 能 源 消耗 预警 系统 ， 对 区 域 能 源 。“ 灌 于 市 场 供需 变化 ， 出 现 进 价 高 于 销售 价格 情况 ， 严 重 影响 
消耗 进行 监察 管理 和 预警 。 然 而 与 区 域 能 源 安全 外 生 警 源 相 关 。 ”利润 获取 。 这 一 能 源 价格 扰动 要 素 就 成 为 区 域 能 源 安全 的 外 
的 研究 成 果 较 少 , 仅 有 学 者 迟 春 洁 04 提 出 了 能 源 安全 外 后 警 源 。 警 源 ， 在 其 集聚 达到 一 定 程度 时 ， 势 必 会 引发 局 部 地 区 出 现 
的 概念 , 而 魏 一 鸣 等 人 L519 在 阅 述 区 域 能 源 安 全 事件 的 基础 上 -， ” 品 能 源 停 供 、 限 供 等 区 域 能 源 安全 事件 。 
分 析 了 诱发 区 域 能 源 安全 事件 的 外 部 关键 因素 。 b) 区 域 能 源 政策 干预 不 当 。 部 分 地 区 为 了 自身 区 域 经 济 发 

通过 对 上 述 文献 资料 梳理 可 知 ， 现 有 的 区 域 能 源 安全 体系 展 或 受到 国家 层面 政策 的 约束 ， 在 特定 时 期 ， 会 强制 性 地 对 能 
尚未 对 诱发 能 源 安全 事件 的 根源 要 素 进行 研究 。 因 此 ， 本 文 从 ， 源 政策 进行 某 种 干预 ， 从 而 引发 局 部 地 区 的 能 源 供需 和 调配 失 
外 部 性 角度 ， 将 影响 区 域 能 源 安全 事件 的 主要 外 部 因素 界定 为 ”” 衡 , 诱发 区 域 能 源 安全 事件 。 例 如 2010 年 11 月 , 浙江 、 江苏 、 
外 生 警 源 ， 并 对 其 内 涵 进 行 界 定 。 通 过 外 生 警 源 案例 来 抽取 外 ”湖南 等 地 爆发 电力 安全 事件 ， 其 原因 是 这 些 地 区 
生 警 源 的 属性 ， 并 构建 外 生 警 源 数据 集 。 结 合 外 生 警 源 数据 集 。 ” 排 指标 ,突击 进行 拉 逆 限 电 2011 年 ， 重 庆 地 区 因 贵 州 煤 贮 能 
的 特点 ， 利 用 多 维 关联 规则 方法 对 外 生 警 源 隐 含 特征 进行 深入 ” 源 产地 突然 对 煤炭 外 销 和 运输 实行 严格 控制 ， 致 使 电 煤 出 现 供 
挖掘 ， 以 期 为 区 域 能 源 安全 预警 提供 决策 参考 。 应 紧张 。 

c) 外 部 环境 变化 。 外 部 环境 变化 这 一 区 域 能 源 安全 的 外 生 
1 能 源 安 全 外 生 敬 源 内 酒 及 特征 属性 警 源 更 多 可 能 会 诱发 局 部 地 区 的 能 源 需求 量 、 能 源 供应 量 发 生 
1.1 区 域 能 源 安 全 外 生 警 源 内 池 突变 ， 导 致 区 域 能 源 安 全 事件 。 通 过 对 近年 来 我 国 各 地 区 突 发 

区 域 能 源 安全 预警 是 指 对 于 蘑 一 地 区 能 源 系统 未 来 的 演化 ”的 区 域 能 源 安全 事件 的 诱因 分 析 ， 将 影响 区 域 能 源 安全 的 外 部 
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趋势 进行 预期 性 评价 ， 以 事先 发 现 其 未 来 运行 中 可 能 出 现 的 间 ”环境 划分 为 四 

题 并 分 析 其 成 因 ， 进 而 为 警 情 分 析 决 策 、 制 定 相应 防范 措施 和 能 源 生 产 和 运输 等 突 发 事件 。 例 如 2008 年 和 2009 年 ， 
缓解 能 源 供需 矛盾 提供 决策 依据 。 确 切 地 说 ， 预 警 是 度量 某 种 。 国 多 个 地 区 连续 两 年 冬季 出 现 突 如 其 来 的 降雪 ， 阻 碍 了 能 源 运 
状态 偏离 预警 线 的 强 弱 程度 、 发 出 预警 信号 的 过 程 ， 其 实质 是 。 输 ， 出 现 了 “ 煤 范 "”“ 电 范 ”。 

对 区 域 能 源 安全 运行 的 稳定 性 程度 的 评判 ， 其 目的 与 作用 在 于 
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录用 定稿 胡 健 等 : 基于 多 维 关联 规则 的 区 域 能 源 安全 外 生 警 源 隐 含 特征 分 析 
1.3 ”外 生 警 源 特征 属性 具体 见 表 1 所 示 
通过 证 经 落 ” sy 荡 ?” 6 昌 荒 ” 0 os 守 ” 等 区 二 能 源 安 一 ee 本 l yp 
和 区 域 能 源 安 全 外 生 警 源 特 征 属性 
全 事件 的 收集 ,对 比分 析 了 各 类 能 源 安全 外 生 警 源 的 形成 机 理 ， 
并 依据 相关 文献 的 研究 ， 抽 取 了 各 类 能 源 安 全 外 生 警 源 共 性 特 
征 ， 并 将 外 生 警 源 特征 属性 分 为 描述 性 属性 和 状态 属性 ， 见 图 描述 性 属 怕 状态 属 必 
1 。 
1.4 “外 生 警 源 特 征 属性 划分 se 
已 SL 
于 区 域 能 源 安全 外 生 警 源 属性 具有 多 维度 特点 ， 用 经 典 发 | | 发 | | 事 | | 诱 | | 波 | | 持 | | 源 | | 济 | | 社 
上- 上 > 示 和 1 A 
4 单 维 规则 方法 无 法 进行 隐 含 特性 的 挖掘 。 因 此 ， 通过 咨 生 | | 生 件 发 用 续 | | 缺 | | 损 | | 会 
的 规则 方法 无 法 进行 性 的 挖掘 。 因 此 ， 首 先 通过 咨 时 | | 类 | | 原 | | 范 时 口 | | 失 | | 及 
询 能 源 安全 领域 的 专家 、 参 考 等 级 划分 的 相关 文献 资料 ， 并 对 间 | | 点 | | 型 | | 因 | | 围 | 间 | | 程 | | 程 | | 响 
区 域 能 源 安全 外 生 警 源 形成 机 理 、 影 响 程 度 的 深入 分 析 ， 对 状 度 | | 度 
态 属 性 进行 量化 划分 ,将 多 维 外 生 警 源 特 征 属性 转换 为 事务 项 。 图 1 外 生 警 源 的 特征 属性 
表 1 外 生 警 源 属性 划分 
属性 区 间 划 分 及 符号 命名 
Ta T, Tc Ta 
发 生 时 间 
春季 夏季 秋季 冬季 
Ps Ps Pe Pa Pe Pr Ps 
发 生地 点 
华北 地 区 华东 地 区 华中 地 区 华南 地 区 ”东北 地 区 ”西南 地 区 ”西北 地 区 
L Lp 天 la 
事件 类 型 靶 一 
石油 安全 事件 煤炭 安全 事 伯 天 然 气 安 全 事件 电力 安全 事件 
Ca Cp Ce Ca Ce Cr Cs 
诱发 原因 
能 源 价 格 变化 能 源 供应 量 突变 能 源 政策 调整 能 源 产 量变 化 然 灾 害 。 突 发 事件 。 季节 交 蔡 变化 
Ra Rp Re Ra Re Rr 
波及 范围 (省 ) 一 
(0, 5] (5, 10] (10, 15] (15, 20] (20, 25] (25, 31] 
Da Ds De Da De Dr 
村 续 时 间 ( 月 ) 一 
(0, 1] (1, 3] (3, 5] (5, 7] (7 (9, 12] 
Ga Gp Ge Ga Ge Cr Gs 
能 源 缺 口 程度 
非常 小 很 小 小 中 等 大 很 大 非常 大 
La Lp Le La Le Lr Lg 
经 济 损失 程度 
非常 小 很 小 小 中 等 大 很 大 非常 大 
Fa F, Fe Fa Fe Fr Fe 
社会 反响 
非常 小 很 小 小 中 等 大 很 大 非常 大 
加 而 ZL 用 于 找 L3， 如 此 下 去 ， 直到 不 能 找到 频繁 万 项 集 。 找 每 个 
2 多维 关联 规则 挖掘 模型 构建 


通过 外 生 警 源 特征 属 


Ca 


挖掘 隐 含 在 外 生 警 源 数据 中 的 规则 。 


性 划分 ， 将 外 生 警 源 案 例 转换 为 了 事 
三 {i1,i2,…,im}。 本 文采 用 Apriori 算法 的 基本 原理 来 
该 方法 


主要 包括 两 个 主要 


需要 一 次 数据 库 扫描 。 

1) 生成 频繁 项 集 
作 L1。Li 用 于 找 频繁 2- 项 集 的 集合 
下 去 ,直到 不 能 找到 频繁 k- 项 集 。 找 每 个 Lk 需要 扫 


一 是 从 事务 项 的 集合 中 找 出 所 有 
繁 项 集 产生 强 关 联 规则 。 
2.1 Apriori 算法 的 基本 原理 


A 


的 频繁 项 频 


= 
全 


Apriori 算法 是 一 利 
集 的 算法 。 算 法 
质 的 先 验 知识 ， 


正如 人 人 


PF 最 有 影响 的 挖 


布尔 关联 规则 频繁 项 


的 名 字 基 于 这 样 的 事实 : 算法 使 用 频繁 项 集 1 


是 


门将 看 到 的 。Apriori 使 用 一 种 称 做 逐 层 


搜索 的 迭代 方法 ， 左 项 集 用 于 探索 (k+l1)- 项 集 


1- 项 集 的 集合 ,该 集合 记 


| 


首先 ， 找到 频繁 
o1 用 于 找 频 繁 2- 项 集 的 集合 L， 


证 
o 


做 工 


库 。 步 又 如 下 : 
a) 找 到 频繁 1- 项 集 。 扫 


首先 找到 频繁 1- 项 集 的 集合 
La, 而 L2 用 于 找 Z3， 依 此 


, 该 集合 记 


描 一 次 数据 


描 事务 数据 库 ，Sup_count(4) 表 示 事 
务 项 集 4 出 现 的 次 数 ，Count (7) 表示 事务 的 个 数 。 


式 (1) 定 


义 频 繁 项 集 的 支持 度 ， 把 满足 最 小 支持 度 的 单个 事务 项 称 作 频 


繁 1- 项 自 


uy 
o 


上 Sup _count (A) 


min—sup (4) Count(T) 


b) 连 接 步 。 通 过 Lxi 与 自 


(1) 


己 连接 产生 候选 k- 项 集 的 集合 。 
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录用 定稿 胡 健 等 : 基于 多 维 关联 规则 的 区 域 能 源 安全 外 生 警 源 隐 含 特征 分 析 
该 候选 项 集 的 集合 记 做 Ck。 设 有 1 和 是 Li 中 的 项 集 。 记 号 10] 1) for 每 个 项 集 11 ELx1 
表示 1; 的 第 j 项 。 为 方便 计算 ， 假 定 事物 项 按 出 现 的 先后 次 序 2) for 每 个 项 集 PEZi 
排序 。 执 行 连接 Ceipel， 其 中 Zel 的 元 素 是 可 连接 的 ， 如 果 它 3) if (n[1]=2[1D) A C2]=2[2D A 人 Ck2]=12[#-2]) 
们 前 (&-2) 个 项 相同 。 即 ， 当 满足 式 (2〉 中 的 条 件 时 ，Lxi1 的 元 。 人 Ck-1]=12[k1]) then { 
素 1 生 是 可 连接 的 ,连接 和 产生 的 结果 项 集 是 [1]n[2]*… 4) c=11m1; // 连接 步 : 产生 候选 集 
[K-11]2[k-1]。 5) if has_infrequent subset(c, ZED then 
st (0[1]=50DA(n[2]=602) Aa...A(i [#2]=4[r-2)) 0) delete c 7/ 盘 枝 步 : 删除 非 频 繁 候选 集 
Uk-1]=4 1- CO) 7) else 增加 c 到 Cx 集合 中 ; 
有 Lk-1]<6[#-1] 8) } 
c) 剪 枝 步 。Cx* 是 Lt 的 超 集 ， 它 的 成 员 可 以 是 也 可 以 不 是 频 9) return Cx 
繁 的 , 但 所 有 频繁 k- 项 集 都 包含 在 Ct 中 。 扫描 数据 库 , 确定 Cx 
中 每 个 候选 的 计数 ， 根 据 式 (1) 最 小 支持 度 确定 Lk。 然而 Ck procedure has frequent subset(c: candidate k-itemset; Lei: 
可 能 很 大 ， 这样 所 涉及 的 计算 量 就 很 大 。 任何 非 频 繁 的 (k-1)- 项 frequent(k-1)-itemset) 
集 都 不 可 能 是 频繁 k- 项 集 的 子 集 。 因 此 ， 如 果 一 个 候选 万 项 集 // 利 用 先 验 知识 
的 (1)- 子 集 不 在 Lr1 中 ， 则 该 候选 也 不 可 能 是 频繁 的 ， 从 而 可 1) for 每 个 (k-1)-subset s of c 
以 从 Cx 中 删除 。 2) if s 4 Lxithen 
2) 产生 强 关 联 规则 在 频繁 项 集 产生 之 后 , 通过 可 信 度 来 输 3) return TRUE; 
出 强 关 联 规则 ， 若 4，B 为 事务 项 集 ， 则 可 信 度 为 4) return FALSE; 
condjonce( A= B)= G) ”3 外 生 警 源 隐 含 特征 挖掘 实例 应 用 
如 果 min_co 表示 为 最 小 可 信和 度 闵 值 , 对 于 每 一 个 频繁 项 3.1 数据 获取 及 预 处 理 
集 1 ， 产 生 1 的 所 有 非 空子 集 。 对 于 每 个 非 空子 集 S， 如 果 满 通过 相关 文献 查阅 、 网 站 资料 搜索 、 专 家 访谈 和 实地 调 下 
足 式 (4)， 则 输出 规则 ，s 寺 4-9 。 等 方式 ， 获 取 了 近年 来 我 国 各 地 区 发 生 的 区 域 能 源 安全 外 生 警 
sp_oomO sa eon 四 源 事件 信息 。 经 过 数据 提取 、 分 析 和 预 处 理 ， 构 建 了 区 域 能 源 
ee 安全 外 生 警 源 事务 数据 库 。 把 表 2 中 五 个 典型 外 生 警 源 案例 作 
2.2 Apriori 算法 的 流程 为 事务 ， 通 过 对 五 个 事务 中 隐 含 的 规则 进行 挖掘 来 说 明 多 维 关 
Apriori 算法 的 流程 如 算法 1 所 示 。 联 规则 方法 的 应 用 过 程 和 验证 方法 的 可 行 性 。 
算法 1 ”Apriori 使 用 根据 候选 生成 的 逐 层 途 代 找 出 频繁 从 表 2 可 知 ， 事 务 由 多 维 属性 来 描述 ， 即 由 多 个 谓词 构成 
项 集 规则 , 因此 利用 多 维 关 联 规则 方法 来 挖掘 隐 含 在 事务 中 的 规律 。 
输入 : 事务 数据 库 D， 最 小 支持 闵 值 min_sup。 首先 利用 表 1 对 事务 的 特征 属性 划分 ， 把 多 维 属性 转换 为 事务 
输出 : 刀 中 的 频繁 项 集 工 。 项 ， 从 而 构建 了 事务 数据 库 。 转 换 的 结果 见 表 3。 
方法 : 3.2 ”频繁 项 集 的 生成 
1) 扫描 数据 库 D， 找 到 频繁 1 项 集 ; 为 方便 扫描 事务 信息 表 ， 假 定 事务 中 的 项 按 属性 的 次 序 存 
2) for (1=2; Lei#O;H++) { 放 ， 事 务 数据 库 中 有 五 个 事务 。 设 定 最 小 支持 度 阔 值 
3) ”Cx=aproiri_gen(Lri, min_sup); 1/ 产生 候选 集 ， 并 剪 枝 ”min_swp=60%， 即 支持 度 计数 阔 值 为 3。 图 2 给 出 了 频繁 项 集 
4) for 每 个 事物 teED{ // 扫 描 D 进行 候选 集 计 数 的 生成 过 程 。 
5) Cr= subset(Ceh; /得 到 上 的 子 集 a) 在 第 一 次 迭代 过 程 中 , 表 3 中 的 每 个 事务 项 都 是 候选 集 ， 
0) for 每 个 候选 集 cE Ci 扫描 事务 数据 库 ， 记 录 每 个 事务 项 在 事务 中 出 现 的 次 数 ， 把 大 
7) c.count+t+; 于 等 于 支持 度 计 数 阔 值 的 事务 项 作为 频繁 1- 项 集 工 1。 
8) } b) 为 发 现 频繁 2- 项 集 ， 执 行 连接 LixL1， 得 到 频繁 2- 项 集 
9) Li= fcECr| c.count>min_sup} 的 候选 集 。 扫 描 事务 数据 库 ， 记 录 每 个 候选 项 集 出 现 的 次 数 ， 
10) } 把 大 于 等 于 支持 度 计数 闵 值 的 候选 项 集 作为 频繁 2- 项 集 L2。 
11) return 工 =UAE /1/ 所 有 的 频繁 集 ; c) 执行 连接 LzxL2， 满足 式 (2) 的 两 个 频繁 2- 项 集 可 连接 
得 到 频繁 3- 项 集 候选 集 。 例如 {7a, Po} 和 {74,Pp} 满 足 条 件 ， 连 
procedure aproiri gen(L#1: frequent (k-1)-itemsets; min_sup: 得 到 频繁 3- 项 集 候 选集 {7T& Pa, Pb} 。 同 时， 要 用 剪 枝 步 删除 不 


可 


minimum support threshold) 可 能 的 项 集 。 例如 {7a, Poa} 和 {7a, Te} 连接 时 ，{ Pa, 天 不 属于 频繁 
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项 集 L, 因此 , 连接 后 的 结果 {72 Pa, /不 可 能 是 频繁 3- 项 集 ， 项 集 作 为 频繁 3- 项 集 L3 。 同 理 ， 频 繁 4- 项 集 、 频 繁 $- 项 集 都 
要 删除 。 得 到 频繁 3- 项 集 的 候选 集 后 ， 扫 描 事务 数据 库 ， 记 录 是 按照 步骤 c) 的 方法 产生 。 
每 个 候选 项 集 出 现 的 次 数 ， 把 大 于 等 于 支持 度 计数 阔 值 的 候选 
表 2 外 生 警 源 数据 表 
事件 编号 E001 E002 E003 E004 E005 
发 生 时 间 2008.01 2009.11 2011.10 2012.11 2013.11 
上 海 、 浙 江 、 江 苏 、 安 徽 、 江 西 、 河 ee ee 0 
| ee 上 四 川 、 重 庆 、 江 苏 、 北京、 河北、 江苏、 浙江、 北京、 天 津 、 河 北 、 内 
、 南 、 湖 北 、 湖 南 、 广 东 、 广 西 、 重 武汉、 西安 。 _ _ 
发 生地 点 _ 加 浙江 、 山 东 、 河 北 、 山东、 湖北、 湖南 、 陕 西 、 蒙古 、 山 西 、 陕 西 、 四 
庆 、 四 川 、 贵 州 、 云 南 、 陕 西 、 甘 南京、 杭州 - 加 到 
_ 湖北 内 蒙古 川 、 云 南 、 贵 州 、 重 庆 
肃 、 青 海 、 宁 夏 、 新 疆 
事件 类 型 力 安全 事件 天 然 气 安全 事件 ”石油 安全 事件 天 然 气 安全 事件 天 然 气 安全 事件 
诱发 原因 自然 灾害 自然 灾害 能 源 价格 波动 季节 交替 变化 季节 交替 变化 
波及 范围 (省 ) 19 4 7 9 10 
持续 时 间 ( 月 ) 1 0.5 2 2 2 
能 源 缺 口 程度 非常 大 中 等 大 并 大 
经 济 损失 程度 非常 大 中 等 大 很 大 很 大 
社会 反响 非常 大 中 等 大 很 大 很 大 
表 3 外 生 警 源 信息 表 
事件 编号 F001 E002 E003 E004 E005 
mn Ti, Py, Pe,Pa, Pi,Ps, la, Ta, Ps, Po,Pa Le,Ce, T,, Ta, Ps, Pp, Pe, Ps, ls, T, PP Pe, Ps,L, Ta, Pa,Ps, Pale, Ca, 
日 关 信息 
Cs, Ra, Da, Go Le,Fe Ra, Da,Ga, La Fa Ca, Rs, Ds, Ge Li, Fe Cs,R», Dy, Ge, Le,Py Ri Dp, Go Le,Fy 
项 集 | 支持 度 计数 项 集 支持 度 计 | 项 集 | 支持 度 计数 
ZT | 5 {Ts Po} 3 {Po, D;} 3 
Ps 3 {Ts Po} 4 {Pa Gy 3 
Ps: 4 {Ta, P.} 4 {Ps, P.} 4 
扫描 信息 表 PF. 4 {Tw PD 3 {Ps, Pe} 3 
有 1 3 连接 了 人 2 
| 得 上 第 2 项 策 。 Ry| 3 | ep 3 
Rs 3 {Ta, D;} 3 {Rs, Ge 3 
D; 3 {Ts Gy 3 {D;, Gy 3 
G; 3 {Pa, Ro} 3 
项 集 支持 度 计 数 连接 万 
人 得 到 频繁 3 项 集 万 
ee 3 项 集 支持 度 计 数 | 。 项 集 。 | 支持 度 计数 
人 DG 3 {7 Po, Ro} 3 {Ts Do Gs} 3 
{ Ts Ps, Pe, Ps} 3 {7 Po, Ds} 3 {Ps Rs, D2} 3 
{7 Ro Ds, Ge} 3 {7 Po Go} 3 {Ps, Rs, G:} 3 
Po, Rs, Ds, Gs 3 
{ } ry {7 Po, Pe} 3 {Pa, Do Gy 3 
4 {Ta Ps,P} 3 {Ps, Pe, Pe} 3 
对 颇 繁 4- 页 4 
得 到 频繁 5- 项 集 六 | A {7 PP 3 {Rs, D;, Ge 3 
项 集 朗 持 度 计数 {Ts PP 3 {TaR,D;} 3 
{Ts Po Rs, Ds, Ge 3 {7 Pel} 3 {7 Rs, Gy 3 
图 2 频繁 项 集 的 产生 
3.3” 强 关联 规则 的 产生 域 能 源 安全 外 生 警 源 爆 发 ， 均 会 在 短 时 间 内 不 同 程度 地 萤 延 到 
得 到 频繁 项 集 后 ， 按 照 式 (4) 来 产生 关联 规则 ， 设 定 最 小 其 他 地 区 ， 滋 生出 更 严重 、 更 广泛 的 能 源 安全 事件 。 通 过 对 区 
可 信和 度 阔 值 min_con 记 100%。 在 外 生 警 源 数据 频繁 项 集 挖 域 能 源 安全 外 生 警 源 规则 集 分 析 可 知 , 187 条 规则 中 共有 12 条 
掘 出 187 条 规则 ， 构 成 了 规则 集 。 本 文 从 规则 集中 截取 部 分 规 规则 支持 衍化 特性 ， 如 规则 16， ee。 六 
则 ， 并 对 规则 进行 了 解读 ， 有 具体 见 表 4 所 示 。 会 蔓延 到 华中 地 区 。 基 于 此 类 衍化 特征 分 析 结 果 ， 有 助 于 缩减 
通过 对 挖掘 出 的 规则 集 进 行 分 析 ， 系 统 归纳 出 了 隐藏 在 区 外 生 警 源 诱 发 的 区 域 能 源 安全 事件 nse 寻 为 当 某 一 地 
域 能 源 安全 外 生 警 源 五 个 典型 案例 中 的 共性 特征 。 区 外 生 警 源 爆 发 后 ， 预 警 信号 就 会 传递 到 相 邻 地 区 ， 使 其 快速 
a) 区 域 能 源 安全 外 生 警 源 衍 化 性 不 论 何 种 性 质 和 规模 的 区 作出 有 效 的 能 源 安全 预警 方案 ， 以 此 降低 能 源 安全 风险 发 生 的 
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录用 定稿 胡 健 ， 等 : 基于 多 维 关联 规则 的 区 域 能 源 安全 外 Vat 二 
概率 或 程度 。 于 警示 各 地 区 提早 做 好 打 持 入 战 的 预案 ， 一 旦 在 外 生 警 源 爆 发 
b) 区 域 能 源 安全 外 生 警 源 季 节 性 基于 对 挖掘 出 的 规则 集 进 后 ， 可 以 有 效应 对 外 生 警 源 持久 性 所 带 来 的 不 利 影响 。 
行 归纳 分 析 可 知 , 区 域 能 源 安全 外 生 警 源 表现 出 较 强 的 季节 性 ， 3.4 在 大 规模 数据 中 的 应 用 效果 
多 数 区 域 能 源 安 全 事件 爆发 在 冬季 ，187 条 规则 中 共有 124 条 为 验证 多 维 关联 规则 挖掘 算法 在 大 量 数据 中 的 应 用 效果 ， 
规则 支持 此 类 时 间 特 性 ， 如 规则 47 和 124 等 。 其 主要 原因 在 本 文 收集 了 从 1999 年 到 2015 年 发 生 的 100 余 个 区 域 能 源 安全 
于 : 在 季节 交替 变化 时 ， 多 数 地 区 冬季 对 能 源 的 需求 量 又 增 ， 外 生 警 源 事件 ， 并 对 外 生 警 源 事 件 进行 数据 提取 、 分 析 和 预 处 
加 之 冬季 易 爆 发 雪灾 等 突 发 事件 频率 较 高 ， 这 会 在 一 定 程度 上 里 ， 构 建 了 区 域 能 源 安全 外 生 警 源 事务 数据 库 。 利 用 多 维 关联 
影响 能 源 的 生产 及 供应 。 基 于 此 类 季节 性 特征 表现 ， 能 有 利于 规则 挖掘 算法 进行 了 规则 挖掘 , 挖掘 结果 见 图 3。 从 图 3 可 知 ， 
各 地 区 根据 季节 性 变化 规律 ， 在 特定 时 期 做 好 能 源 储备 ， 并 对 在 区 域 能 源 安全 外 生 警 源 事 件数 量 较 大 时 ， 多 维 关 联 规则 挖掘 
季节 性 因素 诱发 的 突 发 能 源 事件 进行 实时 预警 ， 降 低 区 域 能 算法 是 可 行 的 ,最 小 支持 度 的 设 定 决定 了 挖掘 出 的 关联 规则 数 ， 
缺口 风险 发 生 的 概率 。 随 着 最 小 支持 度 的 增加 ， 挖 掘 出 的 关联 规则 数 逐 渐 减 少 。 
表 4 部 分 规则 及 说 明 0 
规则 编号 规则 可 信和 度 规则 说 明 
1000 
况 则 11 表明 华北 地 区 能 源 安全 a 
规则 11 {P} 坊 {Dj 100% EE he 下 一 apriori 算 法 
生 警 源 爆 发 要 后 持续 1-3 个 > 
共 则 16 表明 华东 地 区 爆发 的 能 源 慨 600 
规则 16 {Pp} 坊 {Pe} 100% EE 
安全 事件 会 草 延 到 华中 地 区 。 ES a 
六 
规则 47 表明 西北 地 区 的 天 然 气 能 
规则 47 {Ps, LL} 过 {Tx 100% 200 
源 的 外 生 警 源 多 爆发 在 冬季 。 
站 是 站 | [EVE 2 0 ' T T T T T 
a 岗 则 75 表明 华北 地 区 能 源 安全 外 0 bs A Ce 人 
规则 75 100%， 生 警 源 爆 发 时 如 果 持 续 1-3 个 月 ， 最 小 支持 度 
Gs 
a 则 能 源 缺 口 程度 等 级 为 大 。 图 3 多 维 关联 规则 在 大 量 数据 中 的 应 
规则 124 表明 华东 地 区 、 华 中 地 区 
{Ps, PP 一 4 ”结束 语 
规则 124 100% 和 西北 地 区 能 源 安全 外 生 警 源 同时 
7 
下 爆发 时 多 发 生 在 冬季 。 通过 对 区 域 能 源 安全 外 生 警 源 基本 理论 与 多 维 规则 挖 气 方 
规则 130 表明 华中 地 区 和 西北 地 区 本 
{7 Ps, Pe} 一 在 冬季 同时 爆发 能 源 安全 外 生 警 源 以 下 结论 : 
规则 130 100% a 
{Pp} 事件 ， 则 华东 地 区 也 会 发 生 能 源 安 a) 对 区 域 能 源 安全 外 生 警 源 的 内 涵 进 行 了 界定 , 通过 外 生 
全 事件 。 警 源 典 型 案例 的 分 析 ， 抽 取 了 各 类 外 生 警 源 的 共性 特征 ， 构 建 
规则 156 表明 表明 华北 地 区 能 源 安 了 外 生 警 源 的 特征 属性 。 
人 {Ti, Pa, Do, Ge} ee 全 外 生 警 源 在 冬季 爆发 时 如 果 持 续 b) 设计 了 外 生 警 源 多 维 规则 挖掘 方法 , 对 外 生 警 源 特征 属 
鞠 贝 % 
R, 人 对 间 为 1-3 个 月 ， 能 源 缺 口 程度 为 性 进行 了 划分 ， 将 外 生 警 源 多 维 属性 转换 为 了 事务 项 。 在 此 基 
大 ， 则 波及 范围 为 5-10 个 地 区 。 础 上 ， 提 出 了 频繁 项 集 和 强 关联 规则 的 产生 方法 。 
c) 区 域 能 源 安全 外 生 警 源 危 害 性 基于 对 挖掘 出 的 规则 集 分 c) 从 外 生 警 源 案例 集中 截取 了 五 个 典型 案例 来 验证 多 维 关 
析 可 知 ， 区 域 能 源 安全 外 生 警 源 爆 发 后 ， 所 诱发 的 能 源 缺 口 的 联 规则 方法 的 可 行 性 ， 挖 掘 结果 证 明 该 方法 是 可 行 的 ， 发 现 了 
危害 程度 等 级 为 大 , 187 条 规则 中 共有 26 条 规则 支持 外 生 警 源 隐藏 在 外 生 警 源 中 的 规律 。 
的 危害 特性 ， 如 规则 75。 其 原因 在 于 能 源 作 为 区 域 经 济 发 展 的 由 于 区 域 能 源 安全 外 生 警 源 事件 具有 突 发 性 、 复 杂 性 等 特 
主要 基石 ， 一 旦 出 现 缺 口 ， 势 必 会 对 地 区 生产 及 生活 产生 不 利 点 ， 所 以 以 下 尚 待 解决 的 问题 是 今后 研究 重点 是 在 外 生 警 
影响 ， 进 而 阻碍 地 区 的 经 济 发 展 。 基 于 此 类 危害 性 特征 表现 ， 源 数 据 中 挖掘 出 的 规则 较 多 ， 以 后 重点 应 放 在 如 何 剪 枝 上 ; 二 
有 助 于 警示 各 地 区 在 外 生 警 源 爆 发 后 ， 努 力 通过 各 种 途径 积极 是 规则 的 解读 效率 较 低 ， 需 要 增加 领域 知识 来 加 强 对 案例 的 理 
调配 能 源 ， 缩 减 能 源 缺 口 ， 以 此 降低 外 生 警 源 爆发 所 带 来 的 危 解 。 
害 程 度 。 
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